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一 种 H.265 视频 带宽 实时 预测 模型 ” 
HMT, FRF, AAE 
(贵州 大 学 计算 机 科学 与 技术 学 院 , 贵阳 550025) 


摘 要 : 针对 视频 直播 过 程 中 带宽 抖动 导致 视频 帧 丢失 造成 用 户 体验 降低 问题 ， 提 出 了 一 种 Ho 265 视频 带宽 实时 
预测 (VBRP) 模 型 。 模 型 基于 马尔 可 夫 迁 ， 专 注 于 H.265 编码 的 直播 视频 流 ， 研 究 了 在 GOP(group of pictures) 编 码 模 
ATF B 帧 出 现 的 统计 特性 ， 发 现 B 帧 大 小 对 视频 流传 输 速 率 的 影响 较 大 ， 应 用 此 特性 ， 可 预测 出 直播 流 中 B 帧 的 
大 小 ， 并 根据 网 络 带 宽 选 择 性 丢弃 Bh, ANG AD KAS AF AF 和 误差 冰 值 FT， 均 衡 模 型 在 预测 B 帧 时 的 训 
练 频率 和 预测 帧 数 。 最 后 基于 模型 实现 VBRP 预测 算法 并 在 直播 系统 中 验证 算法 的 有 效 性 。 
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Real-time prediction model of H.265 video bandwidth 


Liu Jiangtao, Li Zeping, Yang Bingzhao 
( College of Computer Science & Technology Guizhou University, Guiyang 550025, China) 


Abstract: In order to solve the user experience reduction by bandwidth jitter that caused video frame loss during live video, 
This paper proposed a real-time prediction model (VBRP) of H. 265 video bandwidth. The model is based on markov chain 
and focuses on the live video stream encoded by H. 265. It studied the statistical characteristics of frame B in the 
GOP(Group of pictures) encoding mode, which showed that the B frames size had a great influence on the transmission rate 
of video stream and used this feature, it can predict the size of the B frame, then according to the network bandwidth 
selective discarding the B frame, at the same time used the number of frames adjustment factor AF and error threshold FT, 
to balance the training frequency and the number of predicted frames when predicting B frames. Finally, the prediction 
algorithm is implemented and validated in the live video system. 
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0 引言 1 ”相关 工作 


根据 Netflix 的 2017 年 度 报告 山 全 世界 有 超过 1.17 亿 的 Sarkar 等 人 GJ 提出 了 Markov-modulated gamma-based 框 
Netflix 流 媒体 会 员 ， 每 天 有 超过 1.4 亿 小 时 的 电视 节目 和 电 ” 架 ,Lanfranchi 等 人 外 提出 了 MPEG-4 预测 模型 来 提高 用 户 的 
影 被 观看 。 未 来 ， 流 媒体 流量 预计 将 在 移动 领域 增长 67%， QoE 和 服务 提供 商 的 QoS， 这 些 模 型 必须 适应 动态 变化 的 网 
在 固定 网 络 领域 增长 29% 中 。 多 媒体 内 容 的 爆炸 式 增长 推动 络 条 件 ， 如 吞吐 量 、 丢 包 率 和 延迟 抖动 器。Kalampogia 等 人 
了 流 媒体 行业 的 发 展 和 研究 ， 寻 求 更 高 效 的 流 媒体 发 布 方法 中 提出 的 模拟 退火 算法 来 预测 视频 的 B 帧 ， 然 而 模拟 退火 算 
架构 为 所 有 用 户 提供 更 好 的 视频 服务 成 为 研究 热点 。 在 当前 法 和 MPEG-4 预测 模型 和 对 于 H.265 编码 的 视频 来 说 是 不 够 
的 网 络 服务 中 ， 视 频 流 已 经 占据 了 绝 大 部 分 有 线 和 无 线 的 网 准确 的 。 因 为 H.265 视频 有 许多 比 均值 小 很 多 的 B W, mH. 
络 带 宽 。 H.265/HEVC(high efficiency video coding) 视 频 编码 随机 分 布 在 整个 视频 帧 中 ， 不 能 用 公式 很 好 地 预测 。 根 据 文 
BJ 在 同等 图 像 质量 下 ， 其 压缩 率 比 H.264 标准 提高 了 一 倍 ， 献 [5] 分 析 ， 视 频 模 型 可 以 分 为 两 类 ， 分别 是 数据 速率 模型 和 
所 以 H.265/HEVC 编码 应 用 于 流 媒 体 传 输 将 会 极 大 提高 网 络 贞 大 小 模型 。 数 据 速率 模型 不 能 识别 帧 对 整个 视频 的 影响 程 
带宽 利用 率 。 然 而 ， 网 络 带宽 并 不 总 是 稳定 不 变 的 ， 通 常 带 度 ， 如 果 一 些 包 括 工 帧 在 内 的 很 小 数据 丢失 ， 会 影响 接收 视 
宽 是 一 个 时 变 系统 ， 随 时 间 而 动态 变化 ， 特 别 是 在 高 抖动 、 频 的 质量 。 在 文献 [10] 中 ， 作 者 计算 了 视频 流 数据 包 在 LTE 
高 时 延 的 移动 网 络 环 境 下 尤为 明显 。 如 果 在 视频 直播 中 遇 到 网 络 中 准时 传输 的 概率 ,根据 概率 将 视频 数据 包 分 配给 用 户 ， 
网 络 抖动 ， 将 造成 关键 视频 数据 丢失 ， 影 响 视 频 画 质 ， 传 统 而 不 区 分 视频 帧 不 同类 型 在 各 个 视频 中 的 重要 性 。 然 而 文献 
的 解决 方案 是 根据 网 络 带 宽 的 减少 去 降低 视频 的 质量 内 ， 这 [10] 遵 循 的 是 DASH tHe", 而 DASH 标准 不 适合 非常 低 延 
样 就 给 用 户 带 来 不 好 的 体验 并 且 会 使 服务 质量 下 降 。 如 果 用 迟 的 视频 流 。 文 献 [12] 用 目前 已 知 的 分 布 对 B 帧 进行 建 模 ， 
统计 学 方法 预测 视频 带宽 大 小 ， 并 根据 网 络 带 宽 选 择 性 丢弃 找到 B 帧 的 统计 特性 ， 但 是 对 于 直播 视频 流 ， 即 将 到 来 的 视 
B 帧 。 能 够 平衡 服务 质量 (quality of service，QoS) 与 网 络 带 宽 频 帧 是 未 知 的 ， 无 法 进行 统计 ， 因 此 会 很 大 程度 上 影响 B 帧 
负载 能 力 ， 从 而 提高 用 户 体验 (quality of experience, QoE). 预测 的 准确 性 。 
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针对 以 上 问题 ， 提 出 一 种 H.265 视频 带宽 实时 预测 四 变换 较 大 的 ， 比 如 动作 电影 ， 战 争 电影 ， 标 准 差 是 决定 帧 
(video bandwidth real-time prediction prediction，VBRP) 模 型 。 大 小 变化 的 一 个 重要 指标 。 对 于 这 样 的 视频 ， 除 了 高 平均 码 
VBRP ti HUE > SRT ABE, FP ASR Se BEF 率 的 要 求 之 外 ， 码 率 变化 幅度 也 很 大 。 相 反 ， 低 质量 的 视频 


直播 的 质量 。 在 此 模型 基础 上 实现 了 视频 带宽 实时 预测 
VBRP 算法 ， 应 用 于 RTMP(real time messaging protocol)! yi 
媒体 发 布 预测 系统 ,本文 专 注 的 H.265I 是 继承 H.264 的 新 一 
代 视 频 编 码 标准 ， 与 H.264 一 样 ， 在 视频 编码 序列 中 ， 主 要 
有 三 种 编码 帧 :I 帧 、P B 帧 组 成 GOP, IWER intra-coded 
picture〈 帧 内 编码 图 像 帧 )， 不 参考 其 他 图 像 帧 ， 只 利用 本 帧 
的 信息 进行 编码 ; P 帧 即 predictive-coded picture (预测 编码 
图 像 帧 )， 利 用 之 前 的 工 帧 或 P 帧 , 采用 运动 预测 的 方式 进行 
贞 间 预测 编码 ; B 帧 即 bidirectionally predicted picture 〈 双 向 
预测 编码 图 像 帧 )， 提 供 最 高 的 压缩 比 , 它 既 需要 之 前 的 图 像 
WL WEY P 帧 )， 也 需要 后 来 的 图 像 帧 (P 帧 )， 采 用 运动 预测 
的 方式 进行 帧 间 双 向 预测 编码 。 本 文 研究 了 直播 视频 流 的 统 
计 特 性 ， 即 GOP 编码 模式 下 B 帧 对 传输 速率 的 影响 程度 ， 
说 明了 根据 当前 带宽 负载 能 力 可 选择 地 丢弃 预测 的 B 帧 对 提 
高 用 户 体验 的 意义 


2 H.265 编码 的 直播 视频 流 特征 


H.265 编码 的 视频 流 中 不 但 B 帧 的 数量 占 了 每 个 GOP 的 
绝 大 部 分 而 且 比 起 其 他 帧 B 帧 更 容易 被 压缩 而 丢弃 信息 ， 这 
就 意味 着 B 帧 对 宽带 的 需求 持续 时 间 长 又 比 其 他 帧 更 加 不 稳 
E, 宽带 分 配 还 有 进一步 优化 空间 以 提高 宽带 利用 率 。 男 外 ， 
B 帧 的 重要 性 低 于 其 他 帧 ， 所 以 适当 丢弃 B 帧 对 整个 视频 质 
量 影响 有 限 。 为 了 验证 B 帧 大 小 对 直播 视频 流 变 化 的 影 
本 文采 用 文献 [6 中 的 方法 用 帧 大 小 的 变异 系数 
CoV(coefficient of variation) 来 描述 视频 流 的 速率 变化 。 由 于 
直播 传输 的 视频 片段 时 长 只 有 几 秒 甚至 更 短 ， 因 此 ， 本 文 分 
析 60 分 钟 的 H.265 视频 追踪 文件 。 对 于 给 定量 化 水 平 参数 
QP(quantizer parameter) 编 码 后 的 视频 帧 组 成 的 视频 序列 ， 如 
果 此 视频 序列 由 NN 帧 组 成 ，X,(n=142,3,…,N) 表示 视频 帧 的 大 


H 
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小 ， 那 么 此 视频 的 CoV 定义 如 式 (1) 所 示 。 
Juw- DE, (X, -IN X,Y 
CoV =o/X = UNS. X (1) 
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本 文 从 亚利桑那 州立 大 学 的 视频 追踪 库 03 获 取 了 6 个 不 
同 的 了 .265 视频 描述 文件 用 作 分 析 ， 用 的 视频 包括 “Finding 
Neverland”Lake House”, 另外 还 有 三 个 不 同 质量 的 监控 视频 
描述 文件 。 视 频 文件 压缩 格式 为 G24B7， 每 个 视频 文件 又 根 
据 QP 不同 分 为 三 种 不 同 质量 子 文 件 ,分 别 是 QP=10, QP=25， 
QP=40。 为 了 观察 到 H.265 视频 流 的 特征 ， 分 别 计算 了 不 同 
QP 下 的 BPI 帧 的 标准 差 ， 均 值 和 CoV， 结 果 如 表 工 ， 可 以 
观察 到 B 帧 的 CoV 远大 于 P 帧 和 工 帧 的 COV， 也 就 是 说 B 
帧 的 帧 数 多 于 了 帧 和 工 帧 。 根 据 式 () 可 以 知道 低 质量 的 视频 
QP=40, 整体 上 帧 比较 小 , 导致 均值 和 标准 差 更 小 , 所 以 CoV 
值 较 大 ， 随 着 视频 质量 变 高 ， 三 种 类 型 帧 的 标准 差 ， 均 值 均 
变 大 。 监 控 视频 虽然 B 帧 的 CoV 比 前 两 个 视频 大 ， 但 是 整 


通常 需要 较 低 的 平均 码 率 。CoV 是 描述 码 率 变化 的 一 个 很 好 
的 度量 指标 , 所 以 , 选择 性 丢弃 B 帧 能 尽 可 能 减少 带宽 需求 ， 
平滑 编码 视频 流 。 
表 1 H.265 视频 的 BPI 帧 大 小 的 变异 系数 
Table 1 CoV of B,P and I frames sizes from H.265 videos 
QP B-frames 
STDEV mean CoV STDEV mean CoV STDEV mean CoV 
Finding Neverland 
10 51347 101400 0.506 64148 269387 0.238 82784 337168 0.246 
25 4527 3031 1.494 14196 23304 0.609 23416 43578 0.537 
40 494 304 1.625 2878 3069 0.938 5170 8086 0.639 
Lake House 
10 54241 88444 0.613 84243 232496 0.362 112836 291293 0.387 
25 3703 2233 1.658 18177 19639 0.926 40271 46008 0.875 
40 354 226 1.566 2817 2485 1.134 8268 8816 0.938 
this paper Video 
10 131385 189778 0.692 181907 411579 0.442 209239 527882 0.396 


P-frames I-frames 


25 15471 8582 1.803 37002 46454 0.797 66866 94784 0.705 
40 1022 582 1.756 5483 6505 0.843 19250 20422 0.943 
表 2 EF B 帧 视频 Cov 的 变化 
Table 2 The cov difference after discarding B-frames 

QP B-frames Without-B-frames 
STDEV Mean CoV STDEV Mean CoV 

Finding Neverland 

10 83878 125222 0.67 771770 291980 0.266 

25 12202 6410 1.904 20210 30062 0.672 

40 2207 858 2.572 4475 4741 0.944 

Lake House 

10 81983 108900 0.753 98704 252095 0.392 

25 14193 5508 2.577 30253 28429 1.064 

40 2611 772 3.382 6081 4596 1.323 

this paper Video 

10 165792 222355 0.746 199115 450383 0.442 

25 29891 15332 1.95 54056 62579 0.864 

40 6037 1903 3.172 13661 11149 1.225 


3 ”模型 建立 和 算法 实现 

根据 H.265 编码 标准 , GOP 中 的 B 帧 是 参考 I 帧 和 P ti 
得 到 的 ， 因 此 这 些 帧 的 大 小 可 能 存在 很 强 的 相关 性 。 文 献 
[6,12] 用 式 (2) 计 算 了 MPEG-4，H.264，H.265 编码 视频 GOP 
中 的 每 个 B 帧 大 小 与 每 个 工 帧 或 B 帧 的 相关 系数 cs ， 同 时 
通过 式 (3) 计 算 了 B 帧 的 自 相 关 性 。 结 果 表 明 B 帧 之 间 有 很 强 
的 自 相 关 性 ， 以 及 B 帧 和 了 帧 之 间 也 有 很 强 的 相关 性 ， 所 以 
以 根据 这 些 信 息 更 加 准确 的 预测 B 帧 。 


E(X,Y)-E(X)EY 
p., =- EXV) -EWEV) a 
o0, 
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体 特 征 类 似 。 通 过 均值 和 方差 可 以 看 出 ， 监 控 视 频 的 整体 质 
都 要 高 于 前 两 个 视频 ， 质 量 差异 明显 ， 便 于 观察 差异 o 
对 于 表 2, 可 以 看 到 当 把 视频 中 所 有 B 帧 移 除 , 视频 CoV 
明显 减 小 ， 即 工 帧 和 了 帧 的 大 小 变化 更 少 。 因 此 ， 降 低 帧 大 
小 的 改变 ， 在 网 络 拥堵 不 稳定 时 会 使 H.265 编码 的 视频 流 更 
加 平滑 。 表 2 中 ,没有 B 帧 的 视频 标准 差 和 均值 差 值 不 大 ， 
AB 帧 的 视频 标准 差 与 均值 相差 约 3 倍 ， 总 的 来 说 ， 对 于 画 


中 


IK 


m 
=r 


其 中 :XxX 表 示 B 帧 大 小 ，Y 表示 I 帧 或 P 帧 大 小 ， 
E(X,Y)-E(X)EY) H x AY 的 协 方差 ，o, 和 o, 是 X 和 Y 的 标 
准 差 。 


re) = As DA a) (3) 


其 中 ，X 是 B 帧 的 大 小 ，o, 是 XxX WE, kiet a WR. 
E(XY)-XY 


刘 江 涛 ， 


于 H.265 编码 的 视频 流 里 有 大 量 随机 产生 的 小 的 B 帧 
， 为 了 提高 B 帧 预测 的 准确 度 ， 参 考 文献 [6,12] 提 出 的 对 
B 帧 分 类 的 方法 ， 将 H.265 视频 中 每 个 GOP 包含 的 B 帧 以 
所 有 B 帧 大 小 中 值 为 分 界线 分 为 两 个 子 集 SBF(small 
B-frames) 和 BBF(big B-frames)， 本 文 用 寻找 最 佳 分 布 拟 合 软 
牛 EasyFit 对 大 量 H.265 编码 视频 的 分 析 ， 发 现 H.265 视频 
中 的 小 帧 SBF 的 最 佳 分 布 是 对 数 罗 辑 分 布 或 者 皮尔 逊 V 分 
Ai, K BBF 的 最 佳 拟 合 分 布 大 部 分 是 韦伯 尔 分 布 , 较 少 服 
从 均匀 分 布 ， 与 文献 [12] 一 样 ， 用 最 大 似 然 估 计 方 法 确定 这 
些 分 布 的 参数 。 在 模型 训练 阶段 , 为 了 找到 适合 SBF 和 BBF 
的 最 佳 分 布 ， 用 相对 百分比 误差 (relative percentage error, 
RPE) ZyFi B 帧 的 预测 值 与 真实 值 之 间 的 误差 。 本 文 实验 
用 的 H.265 视频 GOP 模式 为 G24B7 如 表 3 所 示 ， 寻 找 GOP 


if 


[9,12] 


È 


中 的 B1~B21 帧 最 佳 分 布 , 用 来 预测 随后 到 来 的 GOP: HAY B 
帧 。 
表 3 G24B7 的 GOP 编码 模式 
Table 3 The GOP encoding pattern of G24B7 
I. Bil B2... B6 Bi7 P1 Bi8 BY... Bil3 Bil4 P2 Bil5 Bil6 ... Bi20 B21 
L 
RPE= Za x100% (4) 
jl 
Hs, =X, -X, 为 边缘 误差 ， 即 预测 值 与 真实 值 之 间 的 差 。 


除 此 之 外 ， 为 了 更 加 准确 的 找到 最 佳 分 布 ， 本 文 还 用 了 


均匀 绝对 百分比 误差 MAPE(mean absolute percentage error) 
如 式 (6) 以 及 QQ-plot 进行 误差 评估 ，QQ-plot 是 一 种 强大 的 
拟 合 优 度 测试 比较 图 形 (， 它 可 以 直观 得 验证 一 组 数据 是 否 
来 自 同 一 分 布 。 
100%% ]4 -F 
MAPE=—~) | (5) 

其 中 4 为 真实 值 ， 为 预测 值 。 

综 上 所 述 , 提出 了 预测 B 帧 寻找 最 佳 分 布 的 训练 模型 算 
法 如 算法 1 所 示 。 
算法 1 B 帧 寻找 最 佳 分 布 训练 算法 . 


1. im 表示 每 个 GOP 里 B 帧 的 数量 

2. //ArithmeticalMean 是 GOP 里 所 有 B 帧 大 小 的 算术 平均 值 
3. //XPw 和 XPp 表示 X 分 布 关 于 BBF 的 参数 

4. /[XPus 和 XPps 表示 XX 分布 关于 SBF 的 参数 
5 
6 
7 


Procedure FindingTheBestDistribution 
for CountBFrame=0 to m by increment do 
ArithmeticalMean from Bframes; 


if( Bframe < ArithmeticalMean ) 


8. SBF<Bframe; 

9, else BBF—Bframe; 

10. end if 

位， /根据 各 种 分 布 产生 随机 数 

12. LogRB=LogisticRegression(LPap, LPpb); 
13. LogRS=LogisticRegression(LPys, LP?ps); 
14. PearsonVB=PearsonV(PPab, PPep); 

15. PearsonVS=PearsonV(PPus, PPgs); 

16. WeibB=Weibull(WPab, WPpb); 

17. WeibS = Weibull (PPas, PPps); 

18. UniformB=Uniform(UPa», UPpp); 

19. UniformS= Uniform (UPas, UPss); 

20. .…// 其 他 分 布 

21. / DistrbTypeNum 表示 用 了 多 少 种 分 布 
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22. /CriterionListX 表示 存储 各 种 评估 值 的 链表 

23. // DistrbTypeX 表示 以 上 分 布 产 生 关 于 xBF 的 随机 数 

24 for i= 0 to DistrbTypeNum by increment do 

25. 
CriterionListB[RPEType][CountBFrame]RPE(DistrbTypeB[i] ， 
BBF); 

26. CriterionListS[RPEType] 
[CountBFrame]-RPE(DistrbTypeS[i], SBF); 

27. CriterionListB[MAPEType][CountBFrame]—MAPE 
(DistrbTypeB[i], BBF); 

28. CriterionListS[MAPEType] [CountBFrame]«-MAPE 
(DistrbTypeS[i], SBF); 

29. CriterionListB[QQplotType][CountBFrame]—QQplot 
(DistrbTypeB[i], BBF); 

30. CriterionListS[QQplotType] [CountBFrame]—QQplot 
(DistrbTypeS[i], SBF); 

31. end for 

end for 

32. //Choose the best distribution 

33. for CountBFrame =0 to m by increment do 

34. BestDistBBF(CountBFrame)Best(CriterionListB); 

39% BestDistSBF(CountBFrame)+Best(CriterionListS); 

36. end for 


Get(Pop, Poss Ps» 


end Procedure 


后 


> JI 


训 


Bl 
第 二 


BE 


通过 模型 训练 为 
预测 


下 一 个 或 更 多 B 帧 的 大 小 之 前 ， 需 


P ss); 


BBF 和 SBF 找到 最 佳 分 布 以 后 ， 在 此 
判断 即将 到 来 的 


视频 B 帧 类 型 (BB 
分 布 得 到 B WIAA Bh 


BBF i SBF, 需要 以 上 训练 结 


进行 对 H.265 编码 
F 或 者 SBF) 实时 预测 ， 最 后 根据 相应 
预测 值 。 本 文 提 出 了 一 种 基于 马尔 可 


模型 的 预测 算法 ， 为 GOP 的 每 一 个 B 帧 建立 一 条 2 状态 


AK FY ABE 
GOP 里 包含 21 个 


练 时 得 到 ， 


站 


it AB, 


—) 


算法 二 


ALe 


P(t, t+n)=P{X 


N 


m 


图 1 
Fig. 1 


比如 本 文 


中 :1 表示 第 + 个 GOP, 
4 表示 第 i+n 个 GOP 时 的 B WW, 


到 的 GOP 模式 为 G24B7, 
B 帧 ， 就 需要 21 条 不 同 2 状态 


那么 一 
马尔 可 


TR, FES IRASHEA 4 个 转移 概率 :BBF 一 BBF， 
BBF—SBF, SBF—>BBF, SBF 一 SBF， 用 式 (60) 描 
义 4 个 转移 概率 分 别 用 Poo, Poss Pos Pss KEZI 
图 1 表示 
移 概 率 预测 第 t+1 个 GOP 中 的 第 m 个 B 帧 的 类 型 
分 为 两 步 : 
用 最 佳 分 布 产生 B1 


REE 
算法 一 在 
帧 通过 转 
。 以 预测 
第 一 , 计算 出 需要 预测 B1 帧 的 类 型 ， 
贞 大 小 ， 如 图 2 所 示 ， 由 此 提出 


第 t 个 GOP 中 的 第 m 个 B 


=a,|X, =a;} t=1,2,.., N 
4 表示 第 ! 个 GOP 时 的 B 


tn 


WIE, 
表示 在 第 1 个 GOP 


PREG, ER ttn A GOP 转移 到 状态 u 的 概率 。 


GOP, 


GOP +1 
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算法 2 — MEF SRA ABEN Bl 帧 实时 预测 算法 。 å a m <bp (8) 
1. GOPn 表示 GOP 的 数量 WE m > bp 
2. IPs Poss Pos Poss ) 为 转移 矩阵 ， 由 训练 算法 得 到 综 上 ， 改 进 后 的 测试 模型 用 算法 三 来 描述 ， 
3. Procedure B-FramesPrediction 算法 3 一 种 新 的 B1 帧 实时 预测 算法 。 
4 for t=InitalNum to GOPn by increment do 1. // GOPn 表示 GOP 的 数量 
5. /计算 B Wi BBF 和 SBF 的 概率 2. /Pu b， Puk 为 第 tk 个 GOP 大 小 帧 产生 的 概率 
6 (Pulp, Pauls) —( (Pos Pirs)(Pbo, Poss Psp, Pss)) 3. IP; Poss Pos Pss ) 为 转移 矩阵 ， 由 训练 算法 得 到 
7 BestDistribution of BBF or SBF—Max(Pikb, Puks) 4. //PredictN 表示 在 当前 GOP， 需 要 向 前 预测 Bl 帧 帧 数 ， 及 预测 步 
8 // 通 过 最 佳 分 布 预测 B 帧 大 小 长 ， 由 步 长 调节 因子 AF 的 到 
9 Bframe — BestDistribution() Procedure B-FramesPrediction 


. 3 
10. end for 6 for t=InitalNum to GOPn by increment do 
end Procedure T. // 计 算 B 帧 为 BBF 和 SBF 的 概率 
8 
9 


for k=1 to PredictN by increment do 


GOP, GOPt+1 sie GOPt+n 
(Pok. pb, Pek, s) —((Pt. b> Pt, s)(Pob» Pos» Psp» Poss) ) 
10. BestDistribution of BBF or SBF—Max(Pikb> Paks) 
11. /通过 最 佳 分 布 预测 Bi KS 
12. Bframe +— BestDistribution() 
13. if (di=1) drop Bframe 
14. else E = E+|Bframe-RealValue|? 
15. end if 
16. end for 
17. t=t+ k 
18. end for 
图 2 BWM 19. E=mean (RPE, MAPE, QQplot) 
Fig. 2 Markov prediction chains for B frames if (E > FT) 
x 、 20. FT= 1/E x Ax (1-AF)?. 
4 模 型 优 化 21. FindingTheBestDistribution() 
定义 1 B WUE b 与 真实 值 va 之 间 的 误差 , WN 22. endif 
Es end procedure 
E =D bp, -ial| 0) 5 ”实验 与 仿真 
算法 2 通过 初始 模型 的 训练 获得 B 帧 两 种 类 型 BBF 和 51 算法 仿真 
SBF 的 转移 矩阵 , 在 GOP 序列 里 预测 Bi ms Biri, m, Bus2,my .…， 为 了 评估 本 文 提出 VBRP 算法 性 能 , 开发 了 B 帧 预测 程 
Bun, m 帧 (ttn 表示 GOP 序列 号 ，m 表示 一 个 GOP Œ B 帧 序 序 ， 对 ”Finding Neverland”“Lake House” 和 监控 视频 中 1000 


列 号 ) 用 的 转移 矩阵 与 初始 矩阵 一 致 ， 而 视频 直播 过 程 中 , 随 AB 帧 进行 预测 。 质量 为 QP=10 的 视频 文件 作为 预测 程序 
着 时 间 推 移 可 能 不 满足 马尔 可 夫 姻 转移 概率 的 时 齐 性 ， 为 了 的 输入 ， 输 出 为 预测 的 B 帧 序列 ， 来 模拟 直播 视频 流 。 本 实 
尽 可 能 避免 这 种 情况 , 本 文 提 出 了 由 阔 值 FT 来 决定 是 否 重 新 验 验 证 本 文 提 出 的 算法 实际 预测 误差 大 小 百分比 。 选 择 Intel 
训练 ， 因 此 ，FT 值 的 大 小 将 决定 训练 频率 ， 及 当 FT 值 较 大 Core i5-3470 CPU , 16GB DDR3 Centos6.8 操作 系统 的 服务 
时 ,预测 过 程 中 训练 次 数 将 增多 , 算法 消耗 资源 较 多 。 反 之 ， 器 作为 物理 机 实验 平台 。 如 图 2 所 示 , x HA B 帧 的 序列 号 ， 
当 FT 值 较 小 时 ， 预 测 过 程 中 训练 次 数 将 减 小 。 在 此 模型 中 ， y 轴 为 预测 值 与 真实 值 的 绝对 误差 百分比 ， 在 积累 误差 较 大 
当 E>FT 时 开始 再 次 训练 算法 一 ， 其 中 EE 由 式 (6) 得 到 。 又 其 时 ， 本 文 提出 的 VBRP 算法 比 模拟 退火 预测 算法 和 One Set 
A, 每 次 训练 后 原来 的 FT 可 能 不 适用 当前 预测 模型 ， 所 以 需 fits all 更 加 平稳 ， 在 预测 ”Finding Neverland”, “Lake House” 
要 FT 与 B 帧 预测 的 准确 度 建 立 联系 ， 既 不 让 FT 过 大 过 小 ， 和 监控 视频 中 的 B 帧 时 ，VBRP 算法 (图 3 中 黑色 曲线 ) 误 差 


| 


不 让 预测 准确 度 波 动 太 大 。 率 在 3%~25% 之 间 ， 显 著 优 于 其 他 两 种 算法 。 
引入 步 长 调节 因子 AF 及 在 预测 过 程 中 限制 向 前 预测 Bn 5.2 系统 实现 
帧 帧 数 ， 将 有 效 解决 这 一 问题 ， 令 FT = 1/ ExAxFunc(AF), E 为 前 直播 系统 解决 方案 很 多 ， 其 中 比较 出 色 的 有 Adobe 


积累 误差 ，A 为 系数 ，0<AF<1，0<Func(AF) <1 Func(AF) 使 公司 的 RTMP 协议 直播 方案 ，Apple 公司 的 HLS(HTTP live 
得 当 AF 值 较 小 时 ，FT 取 值 较 大 ， 及 预测 算法 执行 次 数 增加 ， streaming) 协 议 直 播 方案 和 谷歌 的 WebRtc 方案 。RTMP 方案 
积累 误差 肯定 会 比 执行 算法 次 数 少时 大 ， 所 以 应 该 加 大 再 次 比较 成 熟 ， 延 迟 低 ， 搭 建 方便 ， 但 是 需要 通用 性 不 够 。HLS 
训练 容忍 度 即 FT 变 大 。 反 之 ，FT 取 值 较 小 。 因 此 ， 一 种 可 方案 适合 各 种 浏览 器 直接 播放 ， 兼 容 性 强 ， 特 别 是 移动 终端 
能 取 值 Func(AF) = (1 - AF)’ 及 FT=1/ExAx(l-AP)” 。 观看 视频 直播 。WebRtc 方案 延迟 低 , 兼容 性 基于 前 两 者 之 间 ， 

为 了 根据 网 络 带 宽 选 择 性 丢弃 B 帧 ,参考 TCP PA SERS h 实现 较 复杂 ， 并 发 性 低 。 因 此 ， 为 了 实验 的 便利 性 ， 本 文 参 
算法 Westwood05 的 带宽 估计 方法 ， 每 个 RTT(Round-Trip ” 考 文献 [16~18] 实 现 了 基于 RTMP 协议 的 视频 直播 系统 。 由 三 
Time) 时 间 内 ， 对 发 送 端 做 带宽 估计 ， 即 RTT ARDI ACK ” 部 分 组 成 : Centos 作为 服务 器 的 基本 操作 系统 ，Nsginx + 
了 多 少 字 节 。 最 后 用 带宽 估计 值 来 决定 B 帧 的 丢弃 与 否 ， 如 Nginx-rtmp-module 作为 流 媒体 发 布 服务 器 ，FFmpeg 作为 推 
式 (8) 所 示 ，di 表示 是 否 丢弃 B 帧 的 结果 。 流 服务 器 。 
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如 图 3 所 示 ， 在 Centos6.8 系统 上 ， 编 译 安装 Nginx 和 的 Chunks 执行 : 重组 一 丢弃 Bio). 第 二 种 方法 ， 将 


Nginx-rtmp-module, 修改 Nginx 的 配置 文件 ,使 其 支持 RTMP ”预测 算法 整合 进 FFmpeg， 训 练 模 型 单独 创建 一 个 训练 线程 ， 
协议 的 流 媒 体 发 布 。 接 着 ,编译 安装 FFmpeg 并 在 编译 时 开 EE Chunks 前 根据 算法 执行 B MER: EF B 帧 一 拆 分 。 
Ja H.265 协议 的 支持 ， 如 -enable-libx265。 最 后 开始 用 第 一 种 方法 增加 了 延 时 ， 使 得 预测 沾 后 ， 影 响 了 整个 预测 系 
FFmpeg 进行 推 流 到 流 媒 体 服务 器 的 缓存 路 径 ， 客 户 端 通过 ”” 统 。 第 二 种 方法 ， 在 编码 H.265 之 后 生成 RTMP 的 Chunks 
ip 地 址 来 观看 直播 视频 。 然 后 对 预测 算法 运行 的 拓扑 位 置 进 之 前 进行 预测 ， 然 后 根据 网 络 带宽 执行 B 帧 丢弃 。 显 然 ， 相 
行 分 析 ， 第 一 种 方法 ， 预 测算 法 整合 进 Nginx 流 媒体 服务 器 。” 对 于 第 一 种 方法 ， 第 二 种 方法 延迟 更 小 ， 消 耗 的 资源 更 少 。 

中 ， 重 组 RTMP 的 Chunks 缓存 ， 再 进行 预测 ， 对 随后 到 来 ”所 以 本 文 实现 了 第 二 种 方法 如 图 4 所 示 。 
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图 3 B 帧 的 预测 值 与 真实 值 的 误差 百分比 


Fig.3 Percentage error between the predicted value and the real value of the B frames 
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Fig.4 System of prediction algorithm running 

6 ”结束 语 eh 完 准 确 度 更 高 的 网 络 带宽 预测 模型 并 将 应 到 模型 中 ， 
7 并 分 析 网 络 带宽 大 小 对 AF 取 值 的 影响 ， 使 AF 的 值 随 网 络 
本 文 提 出 的 VBRP 模型 通过 研究 H.265 编码 的 视频 流 特 ”带宽 大 小 变化 ， 进 一 步 提 高 预测 准确 度 。 

征 ， 根 据 特 征 将 B 帧 分 为 BBF 和 SBF 两 种 类 型 ， 在 训练 阶 参考 文献 : 
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